大家好,我目前正在就讀台大資料科學碩士班。
上學期修李宏毅教授的 ML 一課時,整個學期有 15 次作業,每次作業都是不同的主題,修課同學會將自己訓練好的 model 所預測出來的結果,傳到 Kaggle 或是由教學團隊開發的平台 JudgeBoi ,以評估自己訓練出來的 model 是否有打敗 simple/medium/strong/boss baseline。
猶憶寫作業的那段時間,每天起床第一件事就是去看 model 訓練好了沒、到什麼樣的程度,然後趕快丟結果上去平台跑。不過我時常在辛苦訓練好多天之後,玻璃心地發現自己好像還是得到一隻無動於衷、冥頑不靈的小怪獸,於是又開始投入漫長調參、調架構、調策略的「訓獸」之路。
不過在累積越多經驗後,發現雖然使用 medium 或 strong baseline 的思路,在給予足夠多的時間訓練,在某些設定之下也能收斂到不錯的結果;但是勇敢實作一些更前沿的算法,往往能事半功倍。
因此在未來 30 天的系列文中,我規劃針對 ML 2022 Spring 的 15 門作業,各發兩篇文來介紹該個主題的概念,以及通過 Boss Baseline 的實作方法(如果我有通過的話,就以我的方法為主;沒有的話,我也會分享我收集到的打敗 Boss Baseline 的強者作法)。不過我會先寫 10 個我印象比較深刻的主題,個人覺得好玩的主題會多寫一點篇幅,理解比較淺薄的會少寫一點,之後再看剩幾天把其他主題補上~
因為是二刷這門課,所以接下來的分享,我會比較側重自己學習這門課的 Extra Material 以及作業中可能需要用到的 paper 的讀後心得。
希望這 30 天的生存日記,能夠對同樣正在辛苦升級打怪的「AI 馴獸師」們有所助益。
以下是我主要參考的資料來源:
請大家多多指教,有任何問題或建議,都歡迎留言告訴我~
那麼,就讓我們一起,面對疾風吧!XDD